27 research outputs found

    Estimación de movimiento en imágenes de resonancia magnética cardiaca.

    Get PDF
    En este trabajo de investigación se realizó la implementación de algoritmos de estimación para medir parámetros de movimiento cardiaco sobre imágenes de resonancia magnética (MRI, por su sigla en inglés). Los resultados que aquí se presentan son la obtención de vectores de desplazamiento y frecuencia de movimiento del corazón. Para seleccionar el método más adecuado se realizó un estudio comparativo del desempeño de diferentes algoritmos basados en flujo óptico, de los cuales se escogió la técnica propuesta por Horn y Schunck, debido a que su utilización define una baja tasa de error en la estimación frente a una carga computacional aceptable

    Estimación del ritmo cardíaco mediante análisis de secuencias de vídeo

    Get PDF
    La estimación y el seguimiento de la frecuencia cardíaca han sido esenciales en los campos de la medicina y la ingeniería biomédica a lo largo de los años. En la actualidad, existe un gran interés por extraerla sin contacto, por lo que la estimación de la frecuencia cardíaca mediante el uso de la cámara digital es un área de investigación en rápido crecimiento debido a su bajo costo y su naturaleza no invasiva. El objetivo de este trabajo es diseñar y desarrollar un algoritmo que nos permita detectar el ritmo cardíaco de un individuo mediante el análisis de secuencias de vídeo de su cara. Se ha diseñado e implementado una nueva aproximación, basada en un algoritmo base fundamentado en el trabajo previo en el que nos apoyamos. En primer lugar se realiza la detección facial mediante el algoritmo de Viola-Jones para localizar el área de la imagen que contiene la cara. A continuación, se extrae el movimiento de la cabeza usando el método de Lucas-Kanade y se aísla el movimiento correspondiente al pulso mediante un filtrado. Posteriormente se realiza el análisis de componentes principales (PCA) para seleccionar la componente que mejor se corresponda con los latidos del corazón en función de su espectro de frecuencia temporal. Finalmente, se analiza el movimiento proyectado en esta componente y se estima el ritmo cardíaco como la frecuencia (en bpm) con mayor potencia. Los experimentos muestran que, si los vídeos están grabados bajo unas buenas condiciones, podemos detectar el ritmo cardiaco de una persona obteniendo unas muy bajas tasas de error.The estimation and monitoring of heart rate have been essential in the fields of medicine and biomedical engineering over the years. At present, there is a great interest to extract it without contact, so the estimation of the heart rate by using the digital camera is a research area in rapid growth due to its low cost and non-invasive nature. The objective of this work is to design and develop an algorithm that allows us to detect the heart rhythm of an individual by analyzing video sequences of his face. A new approach has been designed and implemented, starting from a base algorithm based on previous work in which we rely. First, facial detection is performed using the Viola-Jones algorithm to locate the area of the image that contains the face. Then the motion of the head is extracted using the Lucas-Kanade method and the motion corresponding to the pulse is isolated by filtering. Afterwards, the main components analysis (PCA) is performed to select the component that best corresponds to the heartbeat according to its temporal frequency spectrum. Finally, the motion projected to this component is analyzed and the heart rate is estimated as the frequency (in bpm) with greater power. The experiments show that, if the videos are recorded under good conditions, we can detect the heart rate of a person getting low error ratesUniversidad de Sevilla. Grado en Ingeniería de las Tecnologías de Telecomunicació

    Caracterización de movimientos repetitivos mediante algoritmos de procesamiento de imágenes

    Get PDF
    La evaluación de los síntomas de la enfermedad de Parkinson tiene un carácter subjetivo ya que se basa en la experiencia y la agudeza visual del médico tratante, quién realiza una puntuación de 0 a 4 según la Escala Unificada para la Evaluación de la Enfermedad de Parkinson Patrocinada por la Sociedad de Trastornos del Movimiento (MDS-UPDRS, por sus siglas en inglés). El presente trabajo de tesis tiene como objetivo evaluar dos algoritmos de flujo óptico y segmentación de imágenes para cuantificar el golpeteo de dedos y movimiento con las manos, basado en la MDS-UPDRS. El punto de partida para cumplir este objetivo fue el diseño de un protocolo de adquisición de videos, el cual se implementó con 30 participantes sanos que realizaron tres secuencias de cada movimiento. Posteriormente, se realizó el procesamiento de datos con los algoritmos propuestos y se obtuvieron las señales de frecuencia y amplitud. Finalmente se hizo el análisis estadístico. Los resultados muestran que los algoritmos fueron codificados con éxito y se apreciaron los cambios de amplitud y frecuencia de los movimientos repetitivos. Finalmente, se discutieron los resultados basándose en mejoras enfocadas en el protocolo de adquisición de datos que permitan su implementación en un ambiente clínico para contribuir al diagnóstico de pacientes que padecen párkinson

    Control visual de un brazo manipulador con 7GDL, en base a visión monocular, para el seguimiento de objetivos

    Get PDF
    La necesidad de incrementar la producción de las grandes empresas en la Primera Revolución Industrial permitió el desarrollo de nuevas máquinas, tecnologías y actividades, configurando el entorno perfecto para la aplicación de máquinas y procedimientos autónomos como los brazos manipuladores. En la última década se han ampliado las actividades que realizan los brazos manipuladores a diversas áreas como rescate, medicina e industria aeroespacial. La principal tarea de un brazo manipulador es alcanzar un objetivo por medio de sus elementos perceptivos. Esta tarea conlleva escoger los sensores necesarios para percibir el mundo tomando en cuenta el costo, el peso y el espacio. En esta investigación se dará solución a este problema con el uso de un sensor de visión, es decir una cámara. El mecanismo de control que se presenta se basa en dividir el movimiento tridimensional en dos movimientos sobre dos planos: Uno de estos planos es el mismo que el plano de la cámara (plano XY ) y el otro plano será perpendicular al primero y se refiere a la profundidad (plano XZ). El movimiento del objetivo en el plano de la cámara será calculado por medio del flujo óptico, es decir la traslación del objetivo del tiempo t al t + 1 en el plano XY . En cambio, el movimiento en el plano de la profundidad se estimará mediante el filtro de Kalman usando las variaciones de la traslación obtenida del flujo óptico y de la rotación dada por la matriz de cinemática directa. Finalmente, el movimiento planificado en cada plano se ejecutará de forma intercalada infinitesimalmente, obteniendo así un movimiento continuo para los tres ejes coordenados (XY Z). Los resultados experimentales obtenidos, han demostrado que se realiza un camino limpio y suavizado. Se han llevado a cabo pruebas con diferentes intensidades de iluminación, mostrando un error promedio de la trayectoria de movimiento de µx,y,z = 5.05, 4.80, 3.0 en centímetros con iluminación constante, por lo que se tiene una desviación estándar σx,y,z = 2.21, 2.77, 1.45 en centímetros. Al obtener resultados satisfactorios en las pruebas elaboradas. Se puede concluir que es posible solucionar el problema del movimiento tridimensional de un brazo manipulador dividiéndolo en dos sub-problemas que trabajan en planos perpendiculares. Esta solución nos proporciona una trayectoria suave, ya que el mecanismo de control se realiza en cada instante de tiempo obteniendo un movimiento natural.Tesi

    Aceleración de la Estimación del Flujo Óptico y su Aplicación al Códec de Vídeo MCDWT

    Get PDF
    RESUMEN: El flujo óptico de imagen es muy usado en aplicaciones multimedia, visión computacional, codificación/decodificación de vídeo, sin embargo, tradicionalmente es un cálculo que consume muchos recursos de hardware y tiempo. Este trabajo presenta formas de acelerar el flujo óptico denso de imagen entre fotogramas aprovechando la arquitectura CUDA de las tarjetas gráficas de Nvidia mediante OpenCV. También se evalúa la calidad del flujo óptico denso de imagen para varias secuencias, cada una con diferente grado de movimiento de píxeles entre fotogramas, y se diiscutien otras formas de calcular el flujo óptico del estado de arte. Además se evalúa la posibilidad de realizar el mismo cálculo en diferentes plataformas, Windows, Linux, Android gracias a la potabilidad del código Python y C++. Finalmente se integra en el códec MCDWT el código acelerado en la GPU, de una forma trasparente y multi-plataforma, que se activará automáticamente al detectar un sistema CUDA. ABSTRACT: Optical image flow is widely used in multimedia applications, computer vision, video coding/decoding. However, it is traditionally a calculation that consumes many hardware resources and time. This project presents ways to accelerate the dense optical flow of image between frames taking advantage of the CUDA architecture of Nvidia graphics cards through OpenCV. The quality of the dense optical obtained is also evaluated for several sequences, each one with different degree of pixel movement between frames, also discussing other ways to calculate the optical flow in the state of the art. In addition, the possibility of performing the same calculation on different platforms, Windows, Linux, Android is evaluated thanks to the portability of Python and C ++ code on other platforms. Finally, the accelerated code in the GPU is integrated into the MCDWT codec, in a transparent and multi-platform way, which will be activated automatically if a CUDA system is detected

    Corrección del error en el proceso de registro en los sistemas de realidad aumentada utilizando técnicas heurísticas

    Get PDF
    Desde la masificación de los primeros computadores en la década de los 90’s su uso estaba restringido a desarrollar tareas específicas y cálculos repetitivos. En la actualidad, los computadores y sistemas informáticos están permeando cada vez más las actividades humanas, convirtiéndose en lo que Weiser define como Sistemas Ubicuos [Wei99]. Este nuevo paradigma de interacción humano-máquina implica disponer de interfaces naturales que permitan una comunicación efectiva entre el usuario y la máquina, presentando grandes retos para las ciencias de la computación en cuanto al diseño de sistemas, su modelamiento y, en particular, el desarrollo de las interfaces de usuario. En este contexto, las interfaces deben entrar en consonancia con el concepto de Amplificación de la Inteligencia [Bro96][Bro96a] tal que permita la creación de sistemas capaces de amplificar o mejorar las capaces cognitivas humanas en lugar de imitarlas o reemplazarlas. En esta búsqueda de interfaces cada vez más naturales que extiendan las capacidades perceptivas humanas, surge la creación de nuevos entornos y metáforas de visualización como la Realidad Virtual (RV) y la Realidad Aumentada (RA). En particular, la realidad aumentada aparece como un nuevo paradigma de visualización e interacción humano-máquina que permite al usuario obtener información adicional (información virtual) de su entorno e incluso manipular esta información conservando su relación con el ambiente real. La obtención de dicha información adicional, se logra mediante la superposición en el ambiente real, de información virtual generada por computador. La creación de un sistema de realidad aumentada involucra varias etapas, a saber: calibración de dispositivos, extracción de características, seguimiento y registro. Esta última etapa presenta grandes retos para la creación de un ambiente de RA realista, ya que aquí se une tanto la información virtual como la real; si dicha alineación no es correcta, el sistema será visualmente incoherente. Es por esto que el registro es una etapa crítica que actualmente limita las aplicaciones de realidad aumentada. En la presente tesis, se aborda por medio de técnicas heurísticas esta limitación, que ha sido recurrente en la literatura. Como aporte se propone el uso de técnicas heurísticas, las cuales hasta ahora no han sido abordadas en la literatura, para disminuir el error existente entre la información de posicionamiento obtenida en etapas anteriores al proceso de registro (información estimada) y la información real. Dicha disminución en el error se traduce en un alineamiento real-virtual (etapa de registro) mucho más preciso y coherente, obteniendo en consecuencia sistemas o ambientes que apoyen de manera efectiva los problemas de visualización y acceso a información en una mayor cantidad de aplicaciones./Abstarct. Since the first computers appear in the early 90’s, its use was restricted to perform specific tasks and repetitive calculations. Today, computers are getting mixed in human activities more and more, becoming what Weiser [Wei99] defined as ubiquitous systems. This new paradigm of human-machine interaction implies the availability of natural interfaces that allow an effective communication between the user and the machine. It presents great challenges for computer science related to the systems design and modeling, and in particular, the development of user interfaces. In this context, the interfaces must be in relation with the concept of Intelligence Amplification [Bro96][Bro96a], that allows the creation of systems that can amplify or improve human cognitive perceptions rather than imitate or replace them. In this search for more and more natural interfaces that extend human cognitive capacities, new environments and visualization metaphors such as Virtual Reality (VR) and Augmented Reality (AR) rose. In particular, augmented reality appears as a new paradigm for visualization and human-machine interaction that allows the user to obtain additional information (virtual information) from his/her environment and even manipulate this information while preserving their relationship with the real world. Obtaining such information is achieved by the overlap in the real environment, virtual information generated by computer. The creation of an augmented reality system involves several steps, namely, device calibration, feature extraction, tracking and registration. This last stage presents great challenges for creating an realistic AR environment, since this stage binds both the virtual and the real information, if the alignment is not correct, the system will be visually incoherent. This is why the registration is a critical stage which currently limits the applications of augmented reality. In this thesis, this limitation is tackle by means of heuristics. Contributions include the use of heuristics to reduce the error between the position information obtained in previous stages to the registration process (information estimated) and real data. This reduction in error resulting in a real-virtual alignment (registration stage) much more accurate and consistent, thus gaining support to systems and environments to solve effectively visualization problems and access to information in a larger number of applications.Maestrí

    Implementation of a people tracking system and recognition of human actions on video using Deep learning

    Get PDF
    Trabajo de Fin de Máster en Máster en Ingeniería informática, Facultad de Informática UCM, Departamento de Ingeniería del Software e Inteligencia Artificial, Curso 2019/2020El reconocimiento de la actividad en vídeo ha sido objeto de diversos esfuerzos de investigación, debido a la importancia que podría conllevar su uso en el mundo real. Videovigilancia o robótica son dos ramas muy beneficiadas con los avances en este campo, especialmente en el campo de la robótica las tareas relacionadas con la navegación autónoma o la interacción de los robots con seres humanos. Aunque éstos no serían las únicas aplicaciones, ya que la extracción de información inherente a ciertas situaciones nos llevaría a poder hacer análisis detalladas del comportamiento social humano, abriendo un amplio camino por delante. El objetivo de este proyecto es el de implementar un sistema capaz de detectar, realizar seguimiento y reconocer las acciones realizadas por humanos en vídeos. Destacando especialmente 3 partes diferenciadas en el proyecto: • Detección de personas, desde el punto de vista de la detección de objetos mediante técnicas de aprendizaje profundo, estudiando y usando algoritmos como FasterRCNN y YOLO. • Diseño e implementación de un sistema de rastreo, mediante el uso de algoritmos, como el Filtro de Kalman y el algoritmo Húngaro. • Reconocimiento de acciones humanas, para lo cual se usan las técnicas de aprendizaje profundo con mejores resultados en el reconocimiento de actividades en vídeo, las redes convolucionales i3D y las redes resnet 3D, así como la puesta en práctica de algoritmos de procesamientos de flujos ópticos en vídeo.The recognition of the video activity has been the subject of various research efforts, due to the importance that its use in the real world could entail. Video surveillance or robotics are two branches that benefit greatly from advances in this field, especially in the field of robotics, tasks related to autonomous navigation or the interaction of robots with human beings. Although these would not be the only applications, since the extraction of information inherent in certain situations would lead us to be able to make detailed analyzes of human social behavior, opening a wide path ahead. The objective of this project is to implement a system capable of detecting, tracking and recognizing the actions carried out by humans in videos. Especially highlighting 3 different parts in the project: • Detection of humans, testing and using algorithms like Faster-RCNN and YOLO. • Design and implementation of a tracking system, through the use of algorithms, such as the Kalman Filter or the Hungarian algorithm, among others. • Recognition of human actions, for which I will use some of the deep learning techniques with better results in the recognition of video activities, i3D convolutional networks and 3D resnet networks, as well as implement different algorithms for processing optical flows in video. Achieving this will also allow me to carry out a comparison of which achieve the best results.Depto. de Ingeniería de Software e Inteligencia Artificial (ISIA)Fac. de InformáticaTRUEunpu

    Detección y seguimiento de elementos móviles para videovigilancia

    Get PDF
    En los últimos años se ha producido un gran avance en el mundo de la videovigilancia gracias a la aplicación de técnicas de visión artificial. Estas técnicas permiten que un ordenador analice las imágenes recibidas por las cámaras de seguridad detectando, por ejemplo, objetos perdidos o abandonados, así como personas que entran en zonas restringidas o peligrosas. La mayoría de estas aplicaciones de vigilancia basan su funcionamiento en la detección de elementos móviles y su seguimiento. Este trabajo estudia dichas tareas, analizando los distintos algoritmos disponibles en distintos entornos que presentan dificultades. Como resultado de dicho análisis se ha implementado un sistema de videovigilancia completo, combinado ambas etapas que puede servir de base para sistemas de vigilancia más complejos

    Detección de objetos en imágenes utilizando técnicas de aprendizaje profundo (Deep Learning)

    Get PDF
    En este proyecto se tratará de procesar y analizar diferentes retransmisiones deportivas utilizando la herramienta ImageAI. Se explica brevemente cómo se realiza de forma tradicional el procesamiento de imágenes y vídeos. Posteriormente, a través de la herramienta anteriormente mencionada trataremos de obtener la mayor cantidad de información posible a través de la automatización. El objetivo es obtener un vídeo respuesta al código utilizado, detectando el movimiento de los jugadores y los objetos empleados que puede ser utilizado para un sinfín de aplicaciones.Universidad de Sevilla. Grado en Ingeniería de las Tecnologías de Telecomunicació
    corecore